今天刚听完的硅谷 AI 工程师实践分享:AI agent 到底怎么才算真正落地
今天刚听完的硅谷 AI 工程师实践分享:AI agent 到底怎么才算真正落地今晚,我在旧金山 Howard Street 的 Inngest 总部,参加了一场叫做 {AI} in Production 的小型聚会。主办方是 Inngest,Cursor、Arcade、Vapi 联合参与。清一色是在一线真正跑 AI agent 的工程师和创始人,一群人坐在一起,讲他们把 AI 部署进生产环境之后遇到的真实问题。
搜索
今晚,我在旧金山 Howard Street 的 Inngest 总部,参加了一场叫做 {AI} in Production 的小型聚会。主办方是 Inngest,Cursor、Arcade、Vapi 联合参与。清一色是在一线真正跑 AI agent 的工程师和创始人,一群人坐在一起,讲他们把 AI 部署进生产环境之后遇到的真实问题。
最近这段时间,国内外模型更新得很快。
最近,flowith 团队发布了一款叫 Matrix 的产品,要帮你解决这个问题:主打用 Agent 开一家「无人公司」。说白了,就是你当老板设个目标,剩下的调研、生产、发布、获客,交给一整套 AI 员工去跑。它想干的事,听起来有点狂:让每个人都能开一家不需要员工的公司,然后这家公司真的能赚钱。
当 Agent 从演示视频中的炫技片段开始走进真实工作流与生产环境,下一阶段的「何去何从」成为业界关注的焦点。
当大模型应用进入深水区,决定一个 Agent 体验上限的,早已不只是 "答得对不对", 而是 "能不能持续记住同一个人"。
多租户 RAG 与Agent系统的生产实践中,最致命的事故莫过于数据串租,系统将租户 B 的私有数据作为背景知识,回答了租户 A 的提问。
本篇文章根据我在本月 43 Talks 线下活动中的分享整理而成。主理人李继刚邀请我时,给的主题词只有一个:Context。我想从 Agent 的视角出发,讨论一个判断:随着模型和 Harness 逐步趋同,真正决定 Agent 能力边界的,会越来越是 Context。
微信和企业微信的 Agent,同时出牌。
如果只看标题,它很容易被归到“又一个万亿参数大模型”的队伍里:1.6 万亿总参数、MoE 架构、100 万 token 上下文、面向代码和 Agent 场景。但这次真正值得看的,不只是模型有多大,而是它背后的三个问题:国产算力能不能支撑前沿级大模型训练?
Agent 正在逐渐获得「人权」。